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Einrichtung und Verfahren zum Wiedergeben von Audiodaten 
sowie Ccmiputerproexammprodukt hierfiir 

5 Die Erfindung bezieht sich auf eine Einrichtung zum Wiedergeben von 

Audiodaten, welche Audiodaten zu Textdaten eines aus Wortern zusammengesetzten Texts 
korrespondieren, mit Speichermitteln zum Speichern der Audiodaten, in welche 
Speichennittel zu speichemde Audiodaten in einer Vorwartsreihenfolge einspeicherbar 
sind, und mit Steuermitteln zum Steuem des Wiedergebens von gespeicherten Audiodaten 

10 in einem Vorwartsmodus und in einem Ruckwartsmodus, und mit Audio- 
Wiedergabemitteln. 

Die Erfindung bezieht sich weiters auf ein Verfahren zum Wiedergeben von in 
Speichermitteln gespeicherten Audiodaten, welche Audiodaten zu Textdaten eines aus 
Wortern zusammengesetzten Texts korrespondieren und in welche Speichennittel zu 
1 5 speichemde Audiodaten in einer Vorwartsreihenfolge eingespeichert werden, bei welchem 
Verfahren das Wiedergeben von Audiodaten in einem Vorwartsmodus und in einem 
Ruckwartsmodus steuerbar ist 

Die Erfindung bezieht sich weiters auf ein Computerprogrammprodukt sowie 
auf einen Computer, der zum Abarbeiten eines solchen Computeiprogrammprodukts 

* 

20 ausgebildet ist. 

Beim handischen oder automatischen Transkribieren von Texten, insbesondere 
beim Korrigieren von automatisch unter Verwendung von Spracherkennungssystemen 

25 transkribierten Texten, ist es iiblich, den diktierten und in Form von Audiodaten digital 
gespeicherten Text mtf EBlfe von Audio-Wiedergabemitteln, z.B. Kopfhorern, anzuhdren, 
wobei gegebenenfells, bei bereits transkribierten Texten, die zu korrigieren sind, 
gleichzeitig der bereits als Textdatei gespeicherte und zu den gespeicherten Audiodaten 
korrespondierende Text mit EBlfe von Textanzeigemitteln, beispielsweise mit Hilfe von 

30 einen Bildschirm eines Computerarbeiteplatzes, angezeigt wird Insbesondere ist es hierbei 
auch bekannt, die zueinander korrespondierenden Audiodaten und Textdaten mit 
entsprechenden Wort-Markierungsdaten zu versehen, die beispielsweise jeweils einen 
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Wortanfang angeben und die als Vetknupfbngsdaten zueinander korrespondierende, also 
zusammengehorige Audiodaten und Textdaten anzeigen, urn diese synchron im 
Vorwartsmodus akustisch und optisch wiedeizugeben. Eine entsprechende Technik hiefur 
ist beispielsweise in dem Patentdokument WO 01/46853 Al beschrieben. Dabei ist es auch 
5 bekannt, im optisch anzuzeigenden Textteil jenes Wort, das gerade akustisch 

wiedergegeben wird, visuell hervorzuheben, was ebenfalls unter Verwendung der durch 
die Wort-Markierungsdaten bzw. Verkniipfungsdaten gebildeten Steuerdaten realisiert 
werdenkanru 

Ein Anhoren und Anzeigen von Wortern in ihrer Relation zueinander ist 

10 hierbei nur im Vorwartsmodus und in der Vorwartsreihenfolge ermoglicht Wenn 

ausgehend von einer momentanen Wiedergabeposition zu einer vorhergehenden Textstelle 
entgegen der Vorwartsreihenfolge zuriickgesprungen wird, wird gegebenenfalls 
gleichzeitig auch eine Audio- Wiedergabe ermoglicht, jedoch ebenfeUs entgegen der 
Vorwartsreihenfolge und somit in einer unverstandlichen Form. Wenn beispielsweise ein 

1 5 Diktat automatisch oder aber handisch transkribiert wird und die transkribierende und 
gegebenenfalls korrigierende Person von der Person, die das Diktat diktiert hat, 
verschieden ist, wird von dieser das Transkribieren durchfuhrenden Person das 
Zuruckgehen zu vorhergehenden Textstellen als besonders unangenehm empfunden, da ihr 
der gesprochene Text vollig unbekannt ist, und da sie je nach der verfugbaren Software die 

20 Audiodaten - die in digitaler Form in Speichermitteln gespeichert sind - in einer raschen 
Aufeinanderfolge entgegen der Vorwartsreihenfolge in unverstandlicher Form prasentiert 
bekommt Es ist fiir diese Person dann notwendig, manuell ein Wiedergeben in der 
Vorwartsreihenfolge einzuschalten und die betreffenden Diktatteile anzuhoren sowie im 
Fall einer vorhergehenden automatischen Transkription die zugehorigen Textworter visuell 

25 zu uberpriifen, wobei nur in diesem Vorwartsmodus eine zu dem optisch angezeigten Text 
synchrone Audio-Wiedergafoe moglich ist. Dies bedeutet einen vergleichsweise hohen 
Zeitaufwand, wodurch die Konzentration der die Bearbeitungen durchfuhrenden Person 
beeintrachtigt werden kann. Aufierdem wird auch die Effizienz bei der Bearbeitung 
nachteilig beeinflusst 

30 In dem Patentdokument US 2002/0062214 Al ist ein Textmarkierungssystem 

beschrieben, bei dem Wortgruppen an einem Computer-Bildschirm angezeigt werden, 
wobei Schaltfelder zur Steuerung verschiedener Arbeitsschritte vorgesehen sind. Dabei 
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sind zwei gesondert anzusteuernde Schaltfelder vorgesehen, urn ausgehend von einem 
markierten, optisch in einer Textzeile hervorgehobenen Wort zum unmittelbar davor 
stehenden Wort oder zum unmittelbar danach stehenden Wort zu springen, urn dieses Wort 
optisch hervorzuheben und gleichzeitig akustisch wiederzugeben. Diese Steuerung ist 
5 jedoch d*«™, wenn ausgehend von einem bestimmten Wort eine Textstelle relativ weit 
davor, zum Beispiel 10 oder 20 Worter davor, gesucht wird, auBerordentlich muhsam und 
zeitaufwendig, wobei immer wieder ein handisches "Anklicken" des entsprechenden 
Schaltfeldes notwendig ist 

10 

Die Erfindung hat sich zur Aufgabe gestellt, hier Abhilfe zu schaffen und eine 
Einrichtung und ein Verfahren zu realisieren, die ein rasches und zielgerechtes Aufsuchen 
von gesprochenen Textteilen in gespeicherten Audiodaten ermoglichen, wobei auch 
moglichst wenige handische Steuereingriffe seitens der die Bearbeitung durchfiihrenden 
1 5 Person erforderlich sein sollen. 

GemaB einem ersten Aspekt sieht die Erfindung zur Losung der vorstehend 
angefuhrten Aufgabe eine Einrichtung zum Wiedergeben von gespeicherten Audiodaten 

* 

vor, welche Audiodaten zu Textdaten eines aus Wortern zusammengesetzten Texts 
korrespondieren, mit Speichermitteln zum Speichem der Audiodaten, in welche 

i 

20 Speichermittel zu speichemde Audiodaten in einer Vorwartsreihenfolge einspeicherbar 
sind, und mit Steuermitteln zum Steuem des Wiedergebens von gespeicherten Audiodaten 
in einem Vorwartsmodus und in einem Ruckwartsmodus, und mit Audio- 
Wiedergabemitteln, wobei die Steuennittel derart eingerichtet sind, dass sie bei einem 
Wiedergeben von Audiodaten im Ruckwartsmodus ausgehend von der jeweiligen 

25 momentanen Wiedergabeposition in den Audiodaten entgegen der Vorwartsreihenfolge 
selbsttatig ein Zuruckspringen um eine Rucksprunglange, die der Lange von mindestens 
etwa zwei Wortern entspricht, zu einer Zielposition veranlassen und danach beginnend bei 
der jeweiligen Zielposition ein Wiedergeben von Audiodaten in der Vorwartsreihenfolge 
fur nur einen Teil der Rucksprunglange veranlassen. 

30 GemaB einem zweiten Aspekt sieht die Erfindung ein Verfahren zum 

Wiedergeben von in Speichermitteln gespeicherten Audiodaten vor, welche Audiodaten zu 
Textdaten eines aus Wortern zusammengesetzten Text korrespondiereden und in welche 
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Speichermittel zu speichernde Audiodaten in einer Vorwartsreihenfolge eingespeichert 
werden, bei welchem Verfahren das Wiedergeben von Audiodaten in einem 
Vorwartsmodus und in einem Ruckwartsmodus steuerbar ist, wobei bei einem 
Wiedergeben von Audiodaten im Ruckwartsmodus ausgehend von der jeweiligen 
5 momentanen Wiedergabeposition in den Audiodaten selbsttatig urn eine Rucksprunglange, 
die der Lange von mindestens etwa zwei Wortern entspricht, entgegen der 
Vorwartsreihenfolge zu einer Zielposition zuriickgesprungen wird und danach beginnend 
bei der jeweiligen Zielposition ein Wiedergeben in der Vorwartsreihenfolge fur nur einen • 
Teil der Rucksprunglange durchgefuhrt wird 

1 0 Mit dem erfindungsgemaBen Verfahren kann das Suchen bestimmter 

Textpassagen in den Audiodaten im Vergleich zum Stand der Technik rascher und 
effizienter durchgefuhrt werden, Wenn sich beispielsweise bei einem durch eine Person 
durchgefuhrten Transkribieren oder Korrigieren eines Textes beim Erreichen einer 
Textstelle das Problem ergibt, dass diese Person bei einer zuvor transkribierten oder j 

1 5 korrigierten Textstelle, die um 1 0 oder 20 Worter im zu transkribierenden oder zu 1 
korrigierenden Text voiher aufgetreten ist, moglicherweise eine Unklarheit oder eine I 
Unstimmigkeit oder einen Fehler erkennt, so kann auBerordentlich rasch und vollig I 
automatisch - nach Starten des Verfahrens gemaB der ErGndung - ein entsprechendes 1 
Suchen im Ruckwartsmodus durchgefuhrt werden, wobei rechnergestiitzt automatisch I 

20 entsprechend den vorgegebenen Rucksprung^angen weiter zuriickliegende Zielpositionen I 
im Text angesprungen werden und danach fur nur einen vorgegebenen Teil der jeweiligen ] 
Rucksprunglange in der Vorwartsreihenfolge eine akustische Wiedergabe durchgefuhrt I 
wird Dadurch wird eine verstandliche Audio-Wiedergabe realisiert, so dass die jeweilige I 
Person keine Verstandnisschwierigkeiten hat Das Zunickspringen im durch die I 

25 Audiodaten gegebenen Text erfolgt entweder, wenn schon ein korrespondierender I 
transkribierter Text vorliegt, bevorzugt unter Verwendung von Wort-Markierungsdaten als I 
Steueizeichen, welche ublicherweise jeweils den Beginn eines neuen Wortes angeben. I 
Falls noch kein transkribierter Text vorhegt, wird die Rucksprunglange fur das I 
automatische Zunickspringen in den Audiodaten z.B. in Entsprechung zu der mittleren I 

30 Datenlange oder Zeit von zumindest zwei Wortern geschatzt, wobei beispielsweise eine I 
Vorwarts-Wiedergabezeit von ein oder zwei Sekunden zugrundegelegt wird. In diesem I 
Zusammenhang sei daher auch festgehalten, dass die jeweilige Rucksprunglange nicht I 
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exakt der Lange von mehreren tatsachlich gesprochenen Wortern entsprechen muss, da die 
Audiodaten auch in Segmente entsprechend gemittelten "Wort-Langen" unterteilt werden 
konnen. Ahnliches gilt fur die Dauer des nach jedem Zuruckspringen vorgesehenen 
Wiedergebens in der Vorwartsreihenfolge. 
5 Es erfolgt demgemafi bei dem erfindungsgemaBen Verfehren beispielsweise 

jeweils ein Sprung urn (ungefahr) zwei oder drei Worter zuruck und danach eine 
automatische Audio-Wiedergabe jeweils (ungeiahr) eines Wortes, wobei das gerade 
wiedergegebene Wort danach eines der zwei oder drei Worter ist, urn die im jeweils 
nachfolgenden Verfehrensschritt in den Audiodaten zuruckgesprungen wird. Denkbar ist es 
10 jedoch auch, jeweils um eine Rucksprunglange entsprechend einer grdfieren Anzahl von 
W5rtem zuruckzuspringen und beim Wiedergeben in der Vorwartsreihenfolge immer nur 
ein Wort im gesprochenen Text anzusteuern bzw. wiederzugeben, so dass beispielsweise 
nur jedes vierte oder funfte Wort wiedergegeben wird. Es konnen aber auch mehrere 
Worter in der Vorwartsreihenfolge wiedergegeben werden, 
1 5 Die Audio-Wiedergabe kann jeweils einfech wortweise erfolgen, das heiBt bis 

zum Erscheinen der nachsten Wort-Markierungsdaten, wenn diese bereits verfugbar sind, 
wobei diese nachsten Wort-Markierungsdaten den Beginn des nachsten Wortes 
kennzeichnen. Es kann jedoch auch eine segmentweise Wiedergabe mit einer festen 
Wiedergabezeit, beispielsweise im Bereich von 0,5 bis 1,5 Sekunden, z.B. entsprechend 
20 einer gemittelten Wortdauer, durchgeffihrt werden, die von einem Zeitsteuerkreis 

vorgegeben wird. Dies wird vor allem dann der Fall sein, wenn noch kein transkribierter 
Text, mit entsprechenden Wort-Markierungsdaten, vorliegt Auch ist es denkbar, jeweils 
ein Wort zur Ganze und das nachste markierte Wort nur teilweise am Wortanfeng 
wiederzugeben. Ferner ist es denkbar, dass die die Bearbeitung durchfiihrende Person 
25 zwischen den veischiedenen vorstehend angeffihrten Moglichkeiten wahlt 

Weiters wird erfindungsgemaB auch bevorzugt, dass beim beschriebenen 
Ruckwarts-Suchlauf die jeweilige Audio-Wiedergabe in der Vorwartsreihenfolge mit einer 
einstellbaren Geschwindigkeit erfolgt, um seitens der die Bearbeitung durchfuhrenden 
Person den Suchlauf insgesamt je nach Notwendigkeit rascher oder langsamer ablaufen zu 
30 lassen. Das Zuruckspringen zur jeweiligen friiheren Zielposition im wiederzugebenden 
Text, wie sie z.B. durch die erwahnten Wort-Markierungsdaten vorgegeben sein kann, 
kann ganz rasch, also praktisch ohne Zeitverlust, durchgefuhrt werden, wobei bei diesem 
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"raschen Rucklauf ' -Mo dus auch keine akustische Audiowiedergabe durchgefuhrt zu 
werden braucht 



Von ganz besonderem Vorteil ist das erfindungsgemaBe Verfahren in 
Verbindung mit einem Transkriptionssystem einsetzbar, bei dem in an sich herkommlicher 
Weise beispielsweise uber ein Kommunikationsnetz, zJ3. LAN, WAN oder Internet, oder 
fiber Tontrager einlangende Diktate automatisch mit Hilfe von Spracherkennungsmitteln in 
eine Textdatei umgesetzt werden, die sodann mit Hilfe einer Textverarbeitungssoftware 
unter Anhdren der Diktat- Audiodaten uberpruft und gegebenenfells korrigiert wirtL Dabei 
ist eine Verkniipfiing der Worter in der Audiodatei einerseits und der zugehorigen Worter 
in der Textdatei andererseits aufgrund der zugeordneten Wort-Markierungsdaten gegeben, 
die deshalb auch als Verknupftmgsdaten bezeichnet werden. Bei der Wiedergabe wird auf 
den Textanzeigemitteln das jeweils gerade akustisch wiedergegebene Wort auch optisch 
hervorgehoben, beispielsweise durch Unterlegen mit einem hellen BBntergrund (sog. 
IT Highlighten"). Hier sieht die Erfindung einen "synchronen Ruckwarts-Wiedergabe- 
Modus" vor, wobei die Worter der Textdatei der Reihe nach - entgegen der 
Vorwartsreihenfolge - optisch hervorgehoben werden und synchron zu jedem optisch 
hervorgehobenen Wort das zu diesem Wort korrespondierende Wort in den Audiodaten in 
der Aulzeichnungsreihenfolge, also verstandlich, akustisch wiedergegeben wirdL Dadurch 
wird der Vorteil erzielt, dass ein Priifen von zusammenhangenden, optisch angezeigten 
Wortem anhand einer veistandlichen Audio-Wiedergabe der korrespondierenden 
Audiodaten muhelos durchfuhrbar ist Auch wird ein Lokalisieren einer Position im Text 



wesentlich vereinfecht, und insgesamt wird die EflBzienz beim Korrigieren von 
transkribierten Diktaten erhoht 



Die Erfindung kann somit in einem solchen typischen Transkriptionssystem 
mit Vorteil angewendet werden, bei dem Diktate mit Hilfe von Empfangsstationen 
empfangen und mit Hilfe von Transkriptionsstationen automatisch transkribiert werden, 
wonach mit Hilfe von Korrekturstationen ein manuelles Korrigieren der transkribierten 
Diktate und schUefilich mit Hilfe von Abgabestationen ein Abgeben von Textdateien 
entsprechend den empfangenen Diktaten durchgefuhrt wird. Selbstverstandlich kann aber 
die Erfindung auch bei einem Transkriptionssystem eingesetzt werden, das durch einen 
einzigen Rechner, insbesondere Personalcomputer, realisiert ist, mit dem die erwahnten 
Schritte, namlich das Empfangen, das automatische Transkribieren, das Korrigieren und 
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schlieBlich das Ausgeben der Textdaten durchgefuhrt weiden konneiL 

Wie bereits angedeutet kann die Erfindung uberdies auch bei einem manuellen 
Transkribieren eines diktierten Textes eingesetzt werden, wenn anhand des Diktates, also 
der Audiodaten, die angehort werden, manuell an einem Textverarbeitungssystem die 

5 Textdatei, vorzugsweise unter Zuordnen von Verkniipfungsdaten fiir die Audiodaten und 
die Textdaten entsprechend den vorstehend erwahnten Wort-Markierungsdaten, erstellt 
wird, wobei nach dem Erstellungs- oder Transkriptionsvorgang gegebenenfells auch 
Korrekturen durchgefuhrt werden. Insbesondere kann daher die Erfindung auch in einem 
mobilen Diktier- bzw. Audio-Wiedergabegerat in digitaler Bauweise realisiert werden, 

10 GemaB einem dritten Aspekt sieht die Erfindung auch ein 

Computerprogrammprodukt vor, das in einen Speicher eines Computers geladen werden 
kann und Softwarecodeabschnitte umfasst, urn durch deren Abarbeiten nach dem Laden in 
den Speicher des Computers mit dem Computer das erfindungsgemaBe Verfahien 

durchfuhren zu konnen. 
1 5 GemaB einem vierten Aspekt sieht die Erfindung schlieBlich einen Computer 

mit einer Recheneinheit und einem internen Speicher vor, welcher Computer zum 
Abarbeiten des erfindungsgemaBen Q>mputeiprogrammprodukts ausgebildet ist 

» 

« 

20 Die Erfindung wird nachfolgend anhand von bevorzugten 

Ausfiihrungsbeispielen, auf die sie jedoch nicht beschrankt sein soil, und unter 
Bezugnahme auf die in den beiliegenden Zeichnungen enthaltenen Figuren noch weiter 
erlautert 

Die Figur 1 zeigt schematisch einen Ablauf bei einem synchronen Wiedergeben 
25 von Audiodaten und Textdaten in einem Vorwartsmodus. 

Die Figur 2 zeigt schematisch einen Ablauf bei einem Wiedergeben von 
Audiodaten und Textdaten unter gegenseitiger Zuordnung in einem Ruckwartsmodus 
gemaB dem Stand der Technik. 

Die Figur 3 zeigt schematisch einen Ablauf bei einem Wiedergeben von 
30 Audiodaten und Textdaten in einem Ruckwartsmodus gemaB der Erfindung. 

Die Figur 4A zeigt einen dem Ablauf gemaB der Figur 3 ahnlichen Ablauf zum 
horbaren Wiedergeben von Audiodaten in einem Ruckwartsmodus, wobei ein zuvor 
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automatisch transkribierter und zu korrigierender Text veranschaulicht ist 

Die Figur 4B zeigt den anhand des in der Figur 4A gezeigten Ablaufs bei 

einem Wiedergeben im Ruckwartsmodus korrigierten Text als beispielsweise auf einem 

Bildschirm angezeigte Abfolge von Wortern. 
5 Die Figur 5 zeigt schematisch in Form eines Blockschalfbilds ein 

Transkriptionssystem mit einer Einrichtung zur Audio-Wiedergabe, mit der "synchrone 

Ruckwartsmodus-Wiedergabe" gemaB den schematischen Darstellungen gemaB den 

Figuren 3 und 4A durchfuhrbar ist. 

Die Figur 6 zeigt in Form von einem Blockschalibild und auf detailliertere 
10 Weise die fur eine „synchrone Ruckwartsmodus-Wiedergabe" vorgesehenen Systemteile 

des Transkriptionssystems gemaB der Figur 5. 

Die Figur 7 zeigt einen dem Ablauf gemaB der Figur 4A ahnlichen, jedoch 

etwas vereinfecht dargestellten modifizierten Ablauf bei einem Wiedergeben im 

Ruckwartsmodus. 

1 5 Die Figur 8 zeigt in Form von einem Ablaufdiagramm eine Variante fur ein 

Verfahren zum synchronen Wiedergeben im Ruckwartsmodus. 



In der Figur 1 ist schematisch ein Ablauf beim Wiedergeben von Audiodaten 
20 Al .. A4 (allgemein Ai) synchron mit Textdaten Tl ..T4 (allgemein Ti) in einem 

Vorwartsmodus veranschaulicht, wobei das Wiedergeben (Auslesen) der Daten in der 
gleichen Reihenfolge bzw. in der gleichen Richtung bzw. in dem gleichen Sinn wie beim 
Aufeeichnen (Einspeichern) der Daten (in Figur 1 von links nach rechts) erfolgt. Diese 
Reihenfolge wird stets als Vorwartsreihenfolge bezeichnet Die Audiodaten Ai und 
25 Textdaten Ti repiasentieren dabei in zusammengehorenden Paaren eine Aufeinanderfolge 
von Wortern Al/Tl ..A4/T4 eines Textes. Dem jeweiligen Wortanfeng ist ein Wort- 
Markierungscode oder sind Wort-Markierungsdaten M1..M5 (allgemein Mi) zugeordnet, 
die zugleich Verknupfungsdaten fiir eine synchrone Wiedergabe der Audiodaten Ai und 
Textdaten Ti bilden. Bei der Wiedergabe werden die Textdaten Tl, T2...T4 (also 
30 aufeinander folgende Worter) entsprechend den in Figur 1 unten gezeigten Pfeilen 1, 2, 3, 4 
aufeinander folgend angesteuert und optisch auf einem Anzeigemittel (in Figur 1 nicht 
dargestellt) hervorgehoben, und synchron dazu wird aus den entsprechenden digitalen 
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Audiodaten Al, A2..A4 das jeweilige Wort entsprechend den oberhalb hiervon mit Pfeilen 
1, 2, 3 und 4 angegebenen Schritten akustisch wiedergegeben. Dieses gleichzeitige optische 
und akustische Wiedergeben von Wortem des Textes unter Nutzung von Markierungs- 
bzw. VerknupfLmgsdaten Mi in einem Vorwartsmodus ist an sich bekannter Stand der 



5 Technik. 

In der Figur 2 ist schematisch ein ebenso bekannter Ablauf beim Wiedergeben 
in einem Riickwartsmodus veranschaulicht. Hier werden die Worter T4, T3, T2, Tl von 
hinten nach vome, gemaB der Darstellung in Figur 2 von rechts nach links, aufeinander 
folgend gemaB den unteren Pfeilen 1, 2, 3 und 4 angesteuert und auf dem nicht gezeigten 
10 Anzeigemittel visuell hervorgehoben. Gleichzeitig werden unter Verwendung der Wort- 
Markierungs- oder Verknuptungsdaten M5, M4, M3 und M2 die entsprechenden 
Audiodaten A4, A3, A2 und Al , das heiBt die Worter entgegen der Vorwartsreihenfolge 
gemaB den oberen Pfeilen 1, 2, 3 und 4 in Figur 2, wiedergegeben. Dieses akustische 
Wiedergeben erfolgt somit entgegen der Aufzeichnungsreibenfolge, also entgegen der 
1 5 Aufzeichnungsrichtung, und hat daher ein unverstandliches Audiosignal zur Folge. 
Dadurch ist das Auffinden bestimmter Textstellen erschwert und nur aufgrund der 
visuellen Anzeige mSglich, was jedoch der ublichen Arbeitsweise beim Transkribieren 
bzw. Korrigieren von Texten nach einem Diktat entgegensteht, da Personen, die eine 
Transkription oder die Korrektur einer Tianskription durchfuhren, beim Ruckwartssuchen 
20 ebenso wie beim Vorwartssuchen ihre Konzentration auf ein akustisch wiedergegebenes 
Audiosignal richten, wobei diese Personen ja auch beim direkten Bearbeiten entsprechend 
dem gehorten Audiosignal den Text schreiben bzw, komgieren. 

Sofern noch kein transkribierter Text (mit Wortem T1..T4..) vorliegt, ist in 
diesem Fall das Auffinden von weiter zuriickliegenden Wortem unter alleiniger 
25 Ausnutzung der Audiodaten Ai uberhaupt auBerst miihsam. 

Anders als bei diesen bekannten Techniken wild nun vorgesehen, auch im 
dus die einzelnen Audiodaten Ai, beispielsweise in der vorstehenden 
Reihenfolge A4, A3, A2 und Al, jeweils in der Vorwartsreihenfolge, das heiBt in der 
Aufzeichnungsrichtung bzw. in dem Aufzeichnungssinn, akustisch wiederzugeben, wie 
30 dies schematisch in Figur 3 mit den Pfeilen 1, 2, 3, 4 oberhalb der Audiodaten A4, A3, A2, 
Al veranschaulicht ist Gleichzeitig wird, wenn entsprechende Textdaten T4, T3, T2, Tl 
vnriwitiHfiTi isitiH eine visiielle Anzeiee der durch die Textdaten Ti reprasentierten 
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Worter gemaB den Pfeilen 1, 2, 3 und 4 in Figur 3 unten veianlasst 

In der Figur 4A ist nunmehr im Detail veranschaulicht, wie b ei einem 
derartigen "synchronen Wiedergeben im Riickwartsmodus" in den Audiodaten Al bis Ae 
ebenso wie in den zugehdrigen Textdaten Tl bis T6 zuriickgesprungen wird und jeweils 
5 eine verstandliche Audio-Wiedeigabe erzeugt wird Es wird dabei als Beispiel von einer 
Textpassage in einem Diktat ausgegangen, die richtig "TO BE OR NOT TO BE" (siehe 
auch Figur 4B) lautet, die jedoch von einem automatischen Transkriptionssystem in der 
Form wie in der Figur 4A dargestellt transkribiert wurde, namlich als "TWO BEE OR 
NOT TWO BEE". In der Figur 4A ist diese Wortfolge in einem Balken 1 1 veranschaulicl 
10 der als soldier beispielsweise auf einem nicht gezeigten optischen Anzeigemittel, zJB. 
einem Bildschirm, erscheint, um so die einzelnen Worter - die Textdaten T1,T2..T6- 
visuell anzuzeigen. Diese Worter sind auch als entsprechende Audiodaten Al, A2.A6 in 
digitaler Form in der Figur 4A nicht naher gezeigten Audiodaten-Speichermitteln 
gespeichert und aus diesen zur Audio-Wiedergabe auslesbar. Die hiefiir vorgesehenen 
1 5 Wort-Markierungsdaten bzw. Verkniipfungsdaten Mi sind in der Figur 4 A wiederum 
schematisch bei Ml, M2......M7 angedeutet 

Konkret wird nun gemaB der Figur 4A von einer im gesprochenen bzw. 
transkribierten Text Ti weiter hinten (in Figur 4A weiter rechts) liegenden momentanen 
Wiedergabeposition zu einer vorhergehenden Zielposition zuriickgesprungen, z.B. zum 
20 dutch die Verkmhrfum 



r 


WW 


• 





("BEE"). Dieses Zuriickspringen ist in der Figur 4A mit einem Pfeil 1 A angedeutet. 
Danach wird beispielsweise genau dieses Wort A6 aus den gespeicherten Audiodaten Ai in 
der Vorwartsreihenfolge wiedergegeben, vergleiche den Pfeil IB. Am Ende des Wortes 
A6/T6 (bzw. bei einem durch Markierunssdaten M7 markierten nachsten Wort^i wirrl Harm 



seiDsttang, una zwar m diesem tail mit einer Mmdest-Rucksprunglange, die der Lange von 
zwei Wortern A5 + A6 bzw. T5 + T6 entspricht, zum durch die Verkniipfungsdaten M5 
gekennzeichneten Anfeng des Wortes T5 (Textdaten) bzw. A5 (Audiodaten) 
zuriickgesprungen (siehe Pfeil 2A), wonach das Wort A5 in der Vorwartsreihenfolge 
gemaB dem Pfeil 2B als Audiosignal wiedergegeben wird. Dieser Vorgang wird sukzessive 
30 automatisch mit den Wortern A4/T4, A3/T3 usw. wiederholt, vergleiche die Pfeile 3A 
(Zuriickspringen zur Zielposition M4), 3B (akustische Wiedergabe von dem Wort A4 in 
Aufeeichnungsrichtung) usw. bis zu den Pfeilen 6A, 6B. Die Pfeile 1A, 2A, 3A...6A geben 
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in der Figur 4A demgemaB die Riicksprunglangen an, wogegen die Pfeile IB, 2B, 3B...6B 
allgemein diejenigen Teile der Rucksprunglangen angeben, fur die eine Audio-Wiedergabe 

in der Vorwartsreihenfolge erfolgt 

Wahrend des beschriebenen abschnittsweisen Zuruckspringens und Anhorens 

5 der einzelnen Worter Ai in der Vorwartsreihenfolge kann an sich das j eweilige Wort 
unmittelbar korrigiert werden, oder es wird bis zum Beginn der betroffenen Textpassage 
zuruckgekehrt, wonach in iiblicher Weise die gesamte Wortfolge Tl bis T6 durch Anhoren 
in der Vorwartsreihenfolge und opiisches Anzeigen ebenfells in der Vorwartsreihenfolge 
korrigiert werden kann, so dass der richtige Text, gemaB dem Balken 1 1 1 in der Figur 4B, 

10 erhalten wird. 

» 

Wahrend der jeweiligen akustischen Wiedergabe der einzelnen Audiodaten 
ALJV6 werden die dazu korrespondierenden Textdaten T1..T6 am Bildschirm oplisch 
besonders hervorgehoben, beispielsweise durch Anzeigen eines hellen BQntergrundes 

(sogenanntes "Highlighten"). 

15 In der Figur 4A ist schematisch beim Pfeil 2B noch durch eine strichlierte 

Verlangerung angedeutet, dass die akustische Wiedergabe jeweils fiber das besthnmte Wort 
hinausgehend auch das nachstfolgende Wort - teilweise - erfassen kann, das heiBt, dass 
eine "wortuberlappende" Audio-Wiedergabe vorgesehen sein kann. Dies ergibt sich 
beispielsweise dann, wenn zum Beenden des jeweiligen Audio-Wiedergabeschritts nicht 

20 die jeweils nachstfolgenden Markierungsdaten Mi, zum Beispiel M6, als Steuercode 
verwendet werden, sondern wenn eine feste Wiedergabezeit aufgrund einer Zeitzahlung 
vorgesehen ist. Die feste Wiedergabezeit kann beispielsweise eine Sekunde oder 1,5 
Sekunden, eventuell auch etwas unter einer Sekunde betragen. Eine solche vorgegebene 
Zeitdauer fur die Audio-Wiedergabe ist insbesondere dann vorzusehen, wenn noch kein 

25 transkribierter Text vorliegt xmd somit auch noch keine Wort-Markierungsdaten als 

Steuercode verfugbar sind. 

In ahnlicher Weise kann dann auch die Rucksprunglange beim Zuruckspringen 
in Entsprechung zu fix vorgegebenen Zeitspannen, z JB. entsprechend dem Zwei- oder 
Dreifachen einer mittleren Wortlange, bemessen werden. 
30 In der Figur 5 ist ein Beispiel fur eine Einrichtung 12 zum Wiedergeben von 

Audiodaten Ai synchron mit dem Wiedergeben von Textdaten Ti dargestellt, die eine 
Transkriptions-Datenverarbeitimgseinrichtung 13 enthalt. In an sich iiblicher Weise wird 
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bei dieser Einrichtung 12 von Benutzern 14.1 14.N fiber ein Kommunikationsmedium, 

zum Beispiel fiber ein Kotnmunikationsnetz 15, wie LAN, WAN oder Internet, eine 
Diktatdatei an die Einrichtung 12 fibennittelt, die fiber eine Kommunikationseinrichtung, 
im vorliegenden Fall ein Modem 16, empfangen und dann Spracherkennungsmitteln 17 
5 zugefuhrt wild. Es sei erwahnt, dass die Kommumkationsmittel auch durch ein 
sogenanntes "Private Branch Exchange", kurz PBX, realisiert sein konnen. 

Die Spracherkennungsmittel 17, in denen eine an sich fibliche 
Spracherkennungssofiware abgearbeitet wird, fuhren eine automatische Transkription der 
Diktatdatei in eine Textdatei durch, wobei die einzelnen Worter der Textdaten Ti unter 

1 0 Generierung von Wort-Markierungsdaten bzw. Verknfipftmgsdaten Mi in Entsprechung zu 
den einzelnen Audiodaten Ai der zugehorigen Audiodatei abgespeichert werden, und zwar 
in Text-Speichermitteln 18 bzw. in Audio -Speichermitteln 19. Durch die Wort- 
Markierungsdaten Mi werden, wie vorstehend bereits ausgefuhrt, die jeweils einander 
entsprechenden bzw. jeweils zueinander koirespondierenden Worter in den Textdaten Ti 

15 bzw. in den Audiodaten Ai (Text-Speichermittel 18 bzw. Audio-Speichermittel 19) 

einander fest zugeordnet, das heifit miteinander verknupft tJber diese Verknupfung konnen 
durch Steuermittel 20 zueinander gehorende Audiodaten und Textdaten Ai und Ti 
paarweise aufgerufen und wiedergegeben werden. Die von den Steuermitteln 20 
veranlasste visuelle Wiedergabe der Textdaten Ti erfolgt fiber Textverarbeitungsmittel 21 

20 an Anzeigemitteln 22, wie insbesondere an einem Computer-BUdschinii. 

Die akustische Wiedergabe der Audiodaten Ai erfolgt unter Auslesen der 
digital gespeicherten Audiodaten Ai aus den Speichermitteln 19 und Zufuhrung derselben 
, zu einem Wiedergabeschaltkreis 23 fur einen elektroakustischen Wandler 24, wobei in der 
Regel ein Kopfhorer hiefur verwendet wird. Das Auslesen erfolgt hierbei in der 

25 Vorwartsreihenfolge. 

Die Steuerung des gesamten Ablauft beim Zuruckspringen von der jeweiligen 
momentanen Wiedergabeposition zu vorhergehenden Zielpositionen im Text und zur 
synchronen Vorwarts-Wiedergabe erfolgt anhand von in einem internen Speicher 25 
gespeicherten Softwarecodeabschnitten. Als Schnittstelle zum Benfitzer, und zwar zur 

30 Aktivierung der jeweiligen Steuervorgange sowie fur die diversen Eingaben im Zuge der 
Transkription bzw. Textkorrektur, dient eine herkommliche Tastatur oder dergleichen als 
Eingabemittel 26. Es kann auch eine Fufischalter-Bedienungseinrichtung zum Steuem der 
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Vorwarts- undRuckwarts-Wiederg9.be vorgesehen sein. 

Der Wiedergabeschaltkreis 23, der in an sich ublicher Weise einen 
Digital/Analog-Konverter, einen Verstarker und dergl. Komponenten enfhalten kann, und 
der Wandler 24 bilden zusammen Audio-Wiedergabemittel 27. 
5 In der Figur 6 ist mebr im Detail dargestellt, wie die Steuermittel 20 das 

Wiedergeben bzw. das Auslesen von Audiodaten Ai aus den Audio-Speichermitteln 19 und 
das Zufuhren zu den Wiedergabemitteln 27 in Zuordnung zu den Textdaten Ti samt Wort- 
MarMerungsdaten Mi, die z.B. in den Text-Speichermitteln 1 8 gespeichert sind, steuem. 
Dabei ist ein zentraler Steuerkreis 28 direkt bzw. uber Festlegungsmittel 29, die die 
10 jeweilige RQcksprunglange beim Zuruckspringen in den Audiodaten Ai festlegen, mit den 
Audio-Speichermitteln 19 verbunden. Weiters ist mit dem Steuerkreis 28 ein 
Zeitsteuerkreis 30 verbunden, urn beim Ruckwartsmodus wie vorstehend anhand der Figur 
4A beschrieben ein akustisches Wiedergeben der Audiodaten in der Vorwartsreihenfolge 
uber eine vorgegebene, feste Zeitdauer zu ermoglichen. Der Zeitsteuerkreis 30 kann zum , 
1 5 Beispiel ein ublicher Taktgenerator sein, wobei der Steuerkreis 28 die jeweils gewiinschte 
Zeitdauer - die beispielsweise uber die Eingabemittel 26 eingestellt werden kann - durch 
entsprechendes Abzahlen von Taktimpulsen misst. Auf diese Weise kann eine 
Wiedergabe-Zeitdauer (vergleiche Pfeil 2B in Figur 4A) von beispielsweise einer Sekunde 

4 

Oder 1 ,5 Sekunden eingestellt werden. Als Alternative kann, wenn bereits Wort- 
20 Markierungsdaten Mi vorhanden sind, auch eine "wortweise" Wiedergabe gewahlt werden 
wobei bei Erreichen der jeweils nachstfolgenden Markierungsdaten Mi der 
Wiedergabevorgang durch den Steuerkreis 28 beendet wird Vom Zeitsteuerkreis 30 
abgegebene Zeitsteuersignale, insbesondere Taktimpulse, kSnnen auch als Basis fur die 
Bestimmung der Rucksprunglangen in den Fesflegungsmitteln 29 verwendet werden. 
25 Weiters ist es bevorzugt moglich, die Rucksprunglange beim abschnittsweisen 

Zuruckspringen zu Zielpositionen im vorhergehenden Text einzustellen, wobei ein 
trberspringen von jeweils mebr als zwei Wortern, zum Beispiel von drei, vier oder funf 
Wortem, denkbar ist, und wobei entsprechende Anzahl von Markierungsdaten oder 
Verkniipfungsdaten Mi abzuzahlen sind. Zu diesem Zweck ist der Steuerkreis 28 mit 
30 ZaMmitteln 3 1 verbunden. 



Selbstverstandlich konnen diese Zahlmittel 31 ebenso wie der Zeitsteuerkreis 



30 



der Steuermittel 20 realisiert sein, ebenso wie die 
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Festiegungsmittel 29, die durch eine entsprechende Adressierung in den Speichetmitteln 19 
realisiert werden konnen. Es ©lit dann der Steuerkreis 28 gemaB der Figur 6 mit den 
Steuennitteln 20 gemaB der Figur 5 zusammen. Zusatzlich sind noch Einstellmittel 32 zur 
Einstellung der Geschwindigkeit der Audio-Wiedergabe mit den Wiedergabemitteln 27 
5 vorgesehen. 

Es sei erwahnt, dass die Wort-MarMerungsdaten Mi zur Ganze auch in den 
Audio-Speichermitteln 19 bzw. aufgeteilt sowohl in den Text-Speichermitteln 18 als auch 
in den Audio-Speichermitteln 19 gespeichert sein konnen. 

In der Figur 7 ist zwecks besserer Veranschaulichung schematisch die 
Vorgangsweise beim Zuruckspringen um jeweils mehr als zwei Worter, beispielsweise urn 
jeweils drei Worter, veranschaulicht, vergleiche den Pfeil 1 A in Ruckwartsrichtung, wobei 
nach einem solchen Ruckwarts- Sprungvorgang eine Audio-Wiedergabe des jeweils 
folgenden Worts in Vorwartsrichtung, also der Vorwartsreihenfolge, erfolgt, siehe 
beispielsweise Pfeil IB in der Figur 7. Aufdiese Weise werden im Beispiel gemaB der 
Figur 7 nurjene Worter akustisch wiedergegeben, die mit den MarMerungsdaten M7, M5, 
M3, Ml (in dieser Reihenfolge) gekennzeichnet sind, vergl. auch den Punkt uber diesem 
Bezugszeichen in der Figur 7. Jene Worter, denen die Matkierungsdaten M8, M6, M4 und 
M2 zugeordnet sind, werden jedoch hinsichtlich einer akustischen Wiedergabe 
ubersprungen. 

Selbstverstandlich konnen auch mehr als jeweils drei Worter beim 
Zuruckspringen ubersprungen werden, so dass dann bei der jeweils darauffolgenden 
akustischen Wiedergabe nur jedes dritte, vierte usw. Wort wiedergegeben wird 

In der Figur 8 ist ein Ablaufdiagramm dargestellt, anhand von dem beispielhaft 
die Vorgangsweise bei der vorstehend erlauterten synchronen Ruckwartswiedergabe und 
Vorwartswiedergabe erlautert werden soil. Das Ablaufdiagramm umfasst dabei auch 
Konfigurationsschritte und Berechnungsschritte, die dem eigentlichen Ruckwartssprung- 
Vorgang und Vorwarts wiedergabe- Vorgang vorhergehen. 

GemaB der Figur 8 erfolgt einleitend bei einem Block 33 eine Konfiguration 
von Optionen Ol bis 05 hinsichtlich der Audiowiedergabe und der Bemessung der 
30 Rucksprunglangen 1A, 2 A, 3A...6A bei Zuruckspringen in den Audiodaten, wie vorstehend 
beschrieben wurde. Diese Optionen Ol bis 05 konnen beispielsweise wie folgt vorgesehen 
sein: 
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01 - Diese Option Ol wird dann gewahlt, wenn Spracherkennungsmittel 17 
vorgesehen und benutzt werden, urn automatisch Textdaten Ti aus den Audiodaten Ai zu 
ersteUen, wobei dann auch die beschriebenen Wort-Mariderungsdaten Mi von den 
Spracherkermungsmitteln 17 als Verknupfungsdaten selbsttatig festgelegt werden. 

02 - Diese Option 02 betriffi den Fall, dass manuell transkribierte Textdaten 
Ti verwendet werden sollen, um die Lange einzelner Segmente oder 'Worter" der 
Audiodaten Ai festeulegen. Dabei wird gemaB dieser Option 02 eine feste Lange fur alle 
Audio-Segmente vorgesehen, welche Lange mit Hilfe der Steuermittel 20 aus der Gesamt- 
Zeitdauer der Audiodaten Ai und der Anzahl der transkribierten Worter durch einfaches 



25 



berechnet wird. 



ite oder -Worter konnen dam 



tern 



mi 



"nummeriert", d.h. mit Adressen bzw. Indizes versehen werden, um anhand 
oder Adressen die Rucksprunglangen 1 A, 2A, 3i 
wiederzugebenden Teile IB, 2B, 3B...6B zubesl 

* 

03 - Diese der Option 02 sehr ahnliche Option 03 wird gewahlt, wenn - 
ebenfalls auf Basis eines handischen Transkribierens der Textdaten Ti auf grand der 
gehorten Audiodaten Ai - von den Steuermitteln 20 die Audio-Segmente mit variabler 
Lange berechnet werden, und zwar auf Basis der Silben der Worter und der GesamtiSnge 
der Audiodaten Ai. Dabei werden alle Silben als gleich lang angenommen. 

04 - Die Option 04 kann dann gewahlt werden, wenn noch keine Textdaten Ti 
vorliegen, wobei die Lange von Audio-Segmenten oder Wortern der Audiodaten Ai auf dei 
Basis von Audio energieprofil-Informationen berechnet werden. 

05- Bei dieser Option 05 werden Audio-Segmente mit festen Langen 
angenommen, wie z.B. mit Segmentlangen von einer Sekunde, wobei auch beispielsweise 
eine CTberlappung der Segmente, etwa mit einer Zeitdauer von 1/3 Sekunde, vorgesehen 
werden kann. 



30 



Weiters konnen beim Block 33 auch Geschwindigkeiten fur die normale 
Wiedergabe in der Vorwartsreihenfolge, fur das rasche Zuruckspringen und fur ein rasches 
Vorwartswiedergeben sowie auch fur die abschnittsweise Audio- Wiedergabe in der 
Vorwartsreihenfolge beim Zuruckspringen gewahlt werden. 

Bei einem Block 34 wird sodann die bier in Rede stehende Ruckwartsmodus- 



Wiedergabe, beispielsweise durch Betatigen an einer entsprechenden Taste der 
Pinoahemittel 26. Pestartet. Danach wird automatisch bei einem Block 35 abgefragt, 
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Benutzer eine Gesamtsprunglange vorgegeben hat, urn die im Ruckwartsmodus insgesamt 
in den Audiodaten Ai zuruckgesprungen werden soli. 1st dies nicht der Fall (s. Ausgang N 
des Blocks 35), so wird automatisch eine entsprechende Riicksprung-Gesamtlange als 
sogenannter "Defeult"-Wert vorgegeben, wie insbesondere ein Zuruckspringen bis zum 
5 Beginn der Audiodaten, vgl. Block 36 in Figur 8. Hat der Benutzer jedoch eine 

entsprechende Eingabe durchgefuhrt (Ausgang Y des Blocks 35), so wird gemafl einem 
Block 37 die gewahlte Riicksprung-Gesamtlange zugrunde gelegt 

Die so gegebenen zwei Zweige im Ablaufdiagramm von Figur 8 miinden 
sodann wieder zusammen, und bei einem Knoten 38 ist durch einen Pfeil symbolisch 
10 veranschaulicht, dass die ab nun folgenden Schritte im Falle einer Textanderung vor der 
momentanen Audioposition wiederholt werden, ohne dass der Ruckwartsmodus (s. Block 
34) beendet wird. 

Bei einem Block 39 wird dann abgeftagt, ob Spracherkenmmgs-Ausgangsdaten 
vorliegen, cLh. ob automatisch mit KBlfe von Spracherkennungssofiware in 

15 Spracherkennungsmitteln 17 transkribierte Textdateien Ti vorliegen. Wenn dies zutriffi (s. 
Ausgang Y von Block 39 in Figur 8), dann wird bei einem Block 40 abgeftagt, ob die 
Option Ol (s. Block 33) vorgegeben wurde. Wenn dies der Fall ist (Ausgang Y von Block 
40), erfolgt nachfolgend bei einem Block 41 die Berechnung der Audio-Segmente bzw. 
Worter in den Audiodaten Ai in Entsprechung zu den erkannten und editierten Textwdrtern 

20 indenTextdatenTi. 

Wird jedoch keine Spracherkennung verwendet (Ausgang N von Block 39), so 
wird bei einem Block 42 abgeftagt, ob Textdaten Ti vor der momentanen Audio-Position 
vorliegen oder nicht Wenn dies nicht der Fall ist (Ausgang N von Block 42), dh. wenn 
noch keine Textdaten Ti vorhanden sind, wird bei einem Block 43 eine Schatzung der 

25 Lange von Audio-Segmenten auf Basis der Audiodaten-Gesamtlange oder des Audio- 
Energieprofils vorgenommen, vgl. die vorstehende Option 04 bzw. 05. 

Liegen jedoch gemaB der Priifung bei Block 42 bereits Textdaten Ti vor der 
momentanen Audio-Position vor (s. Ausgang Y von Block 42), so wird darauflhdn bei 
einem Block 44 abgeftagt ob beim Block 33 die Option 02 oder 03 konfiguriert wurde, 

30 und wenn eine solche Option 02 oder 03 nicht konfiguriert wurde (Ausgang N von Block 
44), erfolgt ebenfalls die vorstehend im Zusammenhang mit Block 43 beschriebene 
Schatzung. Im Fall des Vorliegens der Konfiguration einer Option 02 oder 03 (Ausgang Y 
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von Block 44) erfolgt bei einem Block 45 daraufliiii erne Schatzung der Lange der Audio- 
Segmente oder Worter der Audiodaten Aiauf der Basis der Audiodaten-Gesamtlange und 
der Anzahl der Worter bzw. Silben (Optionen 02 bzw. 03). 

In dem mit strichlierten Linien umrandenden Bereich 46 des Ablaufe gemaB 
5 der Figur 8 werden nunmehr die eigentlichen Schritte fur das Zuriickspringen und das 
abschnittsweise Wiedergeben in der Vorwartsreihenfolge durchgefuhrt. Dabei wird bei 
einem Block 47 die Audiowiedergabe eines Wortes oder Segmentes der Audiodaten Ai in 
der Vorwartsreihenfolge und somit in verstandlicher Art und Weise gestartet, wobei die 
Wiedergabe mit der beim Block 33 eingestellten Geschwindigkeit erfolgt Bei einem Block 
10 48 wird dann abgefragt, ob das Ende des in der Vorwartsreihenfolge wiederzugebenden 
Wortes oder Segmentes der Audiodaten Ai erreicht ist Wenn dies nicht der Fall ist 
(Ausgang N), wird gemaB einem Block 49 das Wiedergeben fortgesetzt, bis schlieBlich die 
Abfrage beim Block 48 ergibt, dass das Ende des Wortes bzw. Segmentes erreicht ist 
(Ausgang Y von Block 48). Bei einem Block 50 wird sodann in den Audiodaten Ai zur 
1 5 nachsten vorgegebenen Zielposition zuruckgesprungen, beispielsweise urn eine 

Rucksprunglange entsprechend der Lange von drei Wortern. Danach wird bei einem Block 
51 abgefragt, ob die vorgegebene Anfangsposition (vgl. Block 36 bzw. 37) bereits 
ist Wenn dies nicht der Fall ist (Ausgang N), wird zum Block 47 zuruckgekehrt. Wenn 
jedoch die Anfangsposition, dJh. das Ende des Ruckwartsmodus, erreicht ist (Ausgang Y 
20 von Block 51), wird bei einem Block 52 der Ruckwartsmodus beendet 

Vorzugsweise ist auch vorgesehen, dass der beschriebene Vorgang, der an sich 
selbsttatig, durch die Steuermittel 20 gesteuert ablauft, jederzeit vor Erreichen des 
vorgegebenen Endes manuell durch eine "STOP"-Eingabe an den Eingabemitteln 26 
beendet werden kann. 

25 Es sei erwahnt, dass nach dem Korrigieren des Textes unter Umstanden eine 

Neudefinition der Wort-Markierungsdaten Mi oder eine Neuberechnung der Lange der 

Audio-Segmente notig sein kann. 

Es sei weiters erwahnt, dass nach einem Zurackspringen urn mebr als zwei 
Worter, etwa vier, funf, sechs oder mehr Worter, nachfolgend ein akustisch einwandfreies 
30 Wiedergeben von mebr als einem Wort durchgefuhrt werden kann, beispielsweise von 
zwei oder drei oder vier Wortern. 
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Pntftntans pruche: 

1. Einrichtung zum Wiedergeben von gespeicherten Audiodaten vor, welche 
Audiodaten zu Textdaten eines aus Wortern zusammengesetzten Texts korrespondieren, 
mit Speichermitteln zum Speichem der Audiodaten, in welche Speicheimittel zu 
speichernde Audiodaten in einer Vorwartsreihenfolge einspeicherbar sind, und mit 
Steuennitteln zum Steuern des Wiedergebens von gespeicherten Audiodaten 
Vorwartsmodus und in einem Ruckwartsmodus, 

die Steuermittel derart eingerichtet sind, dass sie bei einem Wiedergeben von 
im Ruckwartsmodus ausgehend von der jeweiligen momentanen Wiedergabeposition in 
den Audiodaten entgegen der Vorwartsreihenfolge selbsttatig ein Zuruckspringen urn eine 
Rucksprunglange, die der Lange von mindestens etwa zwei Wortern entspricht, zu einer 
Zielposition veranlassen und danach beginnendbei der jeweiligen Zielposition ein 
Wiedergeben von Audiodaten in der Vorwartsreihenfolge fur nur einen Teil der 

Rucksprunglange veranlassen. 

2. Einrichtung nach Anspruch 1, wobei die Steuermittel derart eingerichtet 
sind, dass sie unter Beniitzung von den Wortern zugeordneten Wort-Markierungsdaten als 
Steuerdaten ein Zuruckspringen zur jeweiligen Zielposition veranlassen. 

3. Einrichtung nach Anspruch 2, wobei den Steuennitteln Zahlmittel zum 
Zahlen von beim Zuiiickspringen bzw. 
zugeordnet sind. 

4. Einrichtung nach Anspruch 1, wobei den Steuennitteln ein Zeitsteuerkreis 
zum Bemessen der Dauer der Audio-Wiedergabe zugeordnet ist 

5. Einrichtung nach Anspruch 1, wobei mit den Steuermhteln Einstelhnittel 
zum Einstellen der Geschwindigkeit der Audio-Wiedergabe verbunden sind. 

6. Einrichtung nach Anspruch 1, wobei die Steuermittel welters mit 
Textspeichermitteln zum Speichem von zu den Audiodaten konespondierenden Textdaten 
verbunden sind, die mit Textanzeigemitteln verbunden sind, und wobei die Steuermittel 
dazu eingerichtet sind, dass sie mit Hilfe von Verknupfungsdaten fur die Audiodaten und 
die Textdaten ein synchrones Wiedergeben der Audiodaten und der hierzu 

enden Textdaten veranlassen. 

7. Einrichtung nach Anspruch 6, wobei die Steuermittel und die 

extspeichermittel sowie 
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Transkription durchfuhrenden Spracherkennungsmitteln verbunden sind. 

8. Verfahren zum Wiedergeben von in Speichermitteln gespeicherten 
Audiodaten vor, welche Audiodaten zu Textdaten eines aus Wortern zus 
Text korrespondiereden und in welche Speichermittel zu speichernde Audiodaten in einer 
Vorwartsreihenfolge eingespeichert werden, bei welchem Verfahren das Wiedergeben von 
Audiodaten in einem Vorwartsmodus und in einem Ruckwartsmodus steuerbar ist, wobei 
bei einem Wiedergeben von Audiodaten im Riickwartsmodus ausgehend von der 
jeweiligen momentanen Wiedergabeposition in den Audiodaten selbsttatig urn eine 
Rucksprunglange, die der Lange von mindestens etwa zwei Wortern entspricht, entgegen 
der Vorwartsreihenfolge zu einer Zielposition zuruckgesprungen wird und danach 
beginnendbei der jeweiligen Zielposition ein Wiedergeben in der Vorwartsreihenfolge fur 
nur einen Teil der Rucksprunglange durchgefuhrt wird. 

9. Verfahren nach Anspruch 8, wobei beim Zuruckspringen zur Zielposition 
den Wortern zugeordnete Wort-Markierungsdaten als Steuerdaten beniitzt werden. 

10. Verfahren nach Anspruch 9, wobei das Wiedergeben in der 
Vorwartsreihenfolge jeweils automatisch beendet wird, wenn beim Wiedergeben die 
nachsten Wort-Markierungsdaten erreicht werden. 

1 1 . Verfahren nach Anspruch 8, wobei das Wiedergeben in der 
Vorwartsreihenfolge jeweils automatisch nach einer vorgegebenen Zeit beendet wird. 

12. Verfahren nach Anspruch 8, wobei nach Beendigung des Wiedergebens in 
der Vorwartsreihenfolge automatisch wieder urn eine Rucksprunglange, die der Lange von 
mindestens etwa zwei Wortern entspricht, zuruckgesprungen wird. 

13. Verfahren nach Anspruch 8, wobei das Zuruckspringen in den Audiodaten 
mit einer gegenuber der Wiedergabegeschwindigkeit beim Wiedergeben in der 
Vorwartsreihenfolge hoheren Geschwindigkeit und ohne akustisches Wiedergeben der 
gespeicherten Audiodaten durchgefuhrt wird. 

14. Verfahren nach Anspruch 8, wobei das Wiedergeben der gespeicherten 
Audiodaten in der Vorwartsreihenfolge mit einer einstellbaren Wiedergabegeschwindigkeit 
erfolgt 

15. Verfahren nach Anspruch 8, wobei synchron mit dem Wiedergeben der 
gespeicherten Audiodaten in der Vorwartsreihenfolge eine visuelles Anzeigen von zu den 
Audiodaten korrespondierenden Textdaten durchgefuhrt wird, welches Anzeigen durch 
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Verknupfungsdaten fur die gespeicherten Audiodaten und die hierzu korrespondierenden 

Textdaten gesteuert wird. 

16. Verfahren nach Anspruch 15, wobei beim visuellen Anzeigen jeweils 

mehrerer Worter der Textdaten jeweils jenes visuell angezeigte Wort optisch 
hervorgehoben wird, von dem die korrespondierenden gespeicherten Audiodaten 

wiedergegeben werden. 

17. Verfahren nach Anspruch 15, wobei die zu Audiodaten 
korrespondierenden Textdaten durch ein automatisches Spracherkennungsverfahren 
gewonnen werden, wobei zugleich die Wort-Markierungsdaten als Verknupfungsdate 
die zueinander korrespondierenden Textdaten und Audiodaten generiert und gespeichert 
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18. Computerprogrammprodukt, das in einen Speicher eines O 
geladen werden kann und Softwarecodeabschnitte umfasst, urn durch deren Abarbeiten 
nach dem Laden in den Speicher mit dem Computer das Verfahren nach Anspruch 8 

durchfuhren zu konnen. 

19. Computerprogrammprodukt nach Anspruch 18, dadurch gekennzeichnet, 

dass es auf einem computerlesbaren Medium gespeichert ist 

20. Computer mit einer Recheneinheit und einem internen Speicher, welcher 
Computer zum Abarbeiten des Computerprogrammprodukts nach Anspruch 18 ausgebildet 

ist. 
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Zusammenfessung: 



Finrirfr1"" fT ™* Verfehren z nm Wiedergeben von Audiodaten 
sowje Q>mwterorogp»r>iTiT>Todukt hierfur 



Beim Wiedergeben von in Speichermitteln (19) gespeicherten Audiodaten (Ai) : 
welche Audiodaten (Ai) zu Textdaten (Ti) eines aus Wortern zusammengesetzten Texts 

10 koirespondieien, wobei das Wiedergeben der Audiodaten (Ai) in einem Vorwartsmodus 
und in einem Ruckwartsmodus steuerbar is t, wird tor das Wiedergeben der Audiodaten 
(Ai) im Ruckwartsmodus ausgehend von der jeweiligen momentanen Wiedergabeposition 
in den Audiodaten selbsttatig entgegen einer Vorwartsreihenfolge urn eine 
Rucksprunglange (1 A, 2A, 3A...6A), die der Lange von mindestens etwa zwei Wortern 

15 entspricht, zu einer Zielposition zuruckgesprungen und danach beginnendbei der 

jeweiligen Zielposition ein Wiedergeben der Audiodaten in der Vorwartsreihenfolge fiir 
nur einen Teil (IB, 2B, 3B...6B) der Rucksprunglange durchgefuhrt 

(Figur 4A) 
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